이젠 음성 대화도 나눈다…'말문' 트인 챗GPT

입력 2023-09-26 17:52   수정 2023-09-27 01:34

생성 인공지능(AI) 챗GPT가 한 단계 더 진화했다. 사람과 음성으로 대화하고, 이미지를 분석해 질문에 답할 수 있는 기능이 추가됐다. 챗GPT 개발회사인 오픈AI가 최종 목표인 범용인공지능(AGI)에 한 걸음 더 다가섰다는 평가가 나온다.

25일(현지시간) 로이터 등에 따르면 오픈AI는 이날 챗GPT에 ‘보고 듣고 말하는’ 새로운 기능을 제공한다고 밝혔다. 프롬프트(명령어)를 대화창에 입력한 것과 원리는 같다. 말로 질문하면 챗GPT가 이를 텍스트로 변환해 대규모언어모델(LLM)에 전달하고, 이에 대한 답변을 다시 음성으로 변환해 말하는 구조다.

오픈AI는 또 세계 최대 음원 스트리밍 서비스인 스포티파이와 협력해 같은 목소리를 다른 언어로 번역하는 방안도 검토 중이라고 설명했다. 이 회사는 이 기능을 향후 2주 안에 챗GPT 유료 구독자에게 제공하고, 이후 모든 사람이 이용할 수 있도록 할 것이라고 밝혔다.

이미지를 보고 답하는 기능도 적용했다. 이용자가 이미지를 대화창에 올리고, 그 이미지를 토대로 질문하면 챗GPT가 이미지를 보고 답해주는 방식이다. 수학 문제를 사진으로 올리면 챗GPT가 사진에 담긴 문제를 인식해 풀이 과정을 설명해줄 수 있다.

오픈AI는 이와 관련한 동영상도 공개했다. 영상에서 한 사용자가 자전거 이미지를 업로드하고 시트 높이를 조정하기 위해 도움을 요청하자 챗GPT는 일반적인 답을 제시했다. 이후 이용자가 자전거 시트 고정 장치 주위에 동그라미를 한 다음 도움을 요청하자 챗GPT는 볼트 유형을 인식하고 육각 렌치가 필요하다고 알려줬다. 또 사용 설명서와 공구 상자의 사진을 보고 올바른 크기의 렌치가 있는지도 확인해 줬다. 이 기능은 향후 몇 주 내 유료 구독자와 기업 이용자에게 제공될 예정이다.

회사 관계자는 “사용자에게 도움이 될 새로운 도구를 꾸준히 제공할 계획”이라며 “최종 목표는 안전하고 유익한 AGI를 구축하는 것”이라고 말했다.

실리콘밸리=최진석 특파원 iskra@hankyung.com


관련뉴스

    top
    • 마이핀
    • 와우캐시
    • 고객센터
    • 페이스 북
    • 유튜브
    • 카카오페이지

    마이핀

    와우캐시

    와우넷에서 실제 현금과
    동일하게 사용되는 사이버머니
    캐시충전
    서비스 상품
    월정액 서비스
    GOLD 한국경제 TV 실시간 방송
    GOLD PLUS 골드서비스 + VOD 주식강좌
    파트너 방송 파트너방송 + 녹화방송 + 회원전용게시판
    +SMS증권정보 + 골드플러스 서비스

    고객센터

    강연회·행사 더보기

    7일간 등록된 일정이 없습니다.

    이벤트

    7일간 등록된 일정이 없습니다.

    공지사항 더보기

    open
    핀(구독)!